GNU gettext

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
GNU gettext

Basisdaten

Hauptentwickler Daiki Ueno
Entwickler GNU-gettext-Team
Erscheinungsjahr 1995
Aktuelle Version 0.22.5[1]
(21. Februar 2024)
Betriebssystem Unix-artige Betriebssysteme, Windows (s. Weblinks)
Programmier­sprache C
Kategorie Lokalisierung
Lizenz GPL: Anwendung und libgettextpo Bibliothek, LGPL: libintl und libasprintf Bibliothek
deutschsprachig nein
GNU gettext Homepage

GNU gettext ist eine GNU-Programmbibliothek zur Internationalisierung von Software. Normalerweise wird sie zur Entwicklung von mehrsprachigen Programmen genutzt.

Arbeitsablauf

Zuerst wird der Quelltext so modifiziert, dass er die GNU-gettext-Funktionen aufruft. Dies wird bei den meisten Programmiersprachen durch Wrappen der Strings erreicht, die durch gettext ausgegeben werden sollen. Aus Gründen der Übersichtlichkeit ist diese Funktion ebenfalls unter dem Namen _ ansprechbar, so dass das folgende Codebeispiel (in C) von

printf("Mein Name ist %s.\n", mein_name);

in

 printf(_("Mein Name ist %s.\n"), mein_name);

geändert werden müsste. Dieses ist gleichbedeutend mit

 printf(gettext("Mein Name ist %s.\n"), mein_name);

GNU gettext ist außer in C mittlerweile auch in C++, Objective-C, sh script, Bash script, Python, Ruby, GNU CLISP, Emacs Lisp, librep, GNU Smalltalk, Java, GNU awk, Pascal, Delphi, Gambas, wxWidgets (mit Hilfe der wxLocale-Klasse), YCP (der YaST2-Sprache), Tcl, Perl, PHP und Pike verfügbar. Die Benutzung von gettext in diesen Systemen ist dabei in der Regel sehr ähnlich derjenigen von C.

Mit xgettext werden die Quelldateien analysiert, um eine .pot-Datei (Portable Object Template) zu erzeugen, die eine Liste aller übersetzbaren Texte (Strings) enthält. Für das obige Beispiel würde der Eintrag in der .pot-Datei in etwa so aussehen:

#: src/name.c:36
msgid "Mein Name ist %s.\n"
msgstr ""

Der Übersetzer erstellt eine .po-Datei (Portable Object) aus der Vorlage mit dem Programm msginit und erstellt anschließend die Übersetzungen. msginit initialisiert die Übersetzung, wenn man also eine englische Übersetzung erstellen möchte, müsste man msginit wie folgt aufrufen:

msginit --locale=en --input=name.pot

Dieser Aufruf würde die Datei en.po erstellen, ein Eintrag in dieser Datei würde z. B. so aussehen:

#: src/name.c:36
msgid "Mein Name ist %s.\n"
msgstr "Mein Name ist %s.\n"

Der Übersetzer müsste dann entweder manuell oder mit einem Werkzeug wie Poedit oder Lokalize (ehemals KBabel) die entsprechenden Texte ersetzen. Nach getaner Arbeit würde der Beispieleintrag so aussehen:

#: src/name.c:36
msgid "Mein Name ist %s.\n"
msgstr "My name is %s.\n"

Abschließend werden die .po-Dateien mit msgfmt in binäre .mo- (Machine Object) bzw. .gmo-Dateien (GNU Machine Object) übersetzt. Diese können nun mit dem Softwarepaket ausgeliefert werden. Damit die Bibliothek die Datei findet, wird sie nun in ein (z. B. in C mittels der Funktion bindtextdomain(name,"/usr/share/locale")) vordefiniertes Verzeichnis kopiert. Das Objekt namens name.mo (name ist die Domain, also z. B. der Name des Programmpakets, angegeben als erstes Argument von bindtextdomain()). Das Message Object liegt dann in /usr/share/locale/<Sprachkürzel>/LC_MESSAGES/name.mo.

Es empfiehlt sich häufig auch für deutsche Programmierer, die Originaltexte auf Englisch zu verfassen, ansonsten müsste ein Übersetzer sowohl Deutsch als auch die Zielsprache beherrschen. Eine alternative Strategie ist, statt ganzen Sätzen kurze Begriffe zu verwenden (z. B. „form_submit“), was zum einen den Vorteil hat, dass diese generischen „Schnipsel“ an mehreren Stellen im Code verwendet werden können, aber in der Lokalisierungsdatei nur einmal übersetzt werden müssen. Um denselben Effekt mit ganzen Sätzen zu erzielen, müssten diese Zeichen für Zeichen identisch sein, was recht fehleranfällig ist. Zum anderen lassen sich durch diese Wahrung des Kontexts sprachliche Mehrdeutigkeiten vermeiden, die vor allem bei kurzen Sätzen oder gar einzelnen Wörtern auftreten können. Möchte man beispielsweise das englische Wort „Order“ einerseits für die Sortierreihenfolge und andererseits als „Bestellen“ benutzen, hätte man bei einer eins-zu-eins Übersetzung Schwierigkeiten, wohingegen man bei der Verwendung kontextsensitiver Begriffe einmal ein „order_by“ und einmal ein „submit_order“ benutzen könnte.

Der Benutzer auf einem Unix- (oder Unix-ähnlichen) System definiert die Locale mithilfe der Umgebungsvariablen LC_ALL, LC_MESSAGES bzw. LANG und LANGUAGE.

Unter Windows wird automatisch die Sprache verwendet, die unter „Region“ eingestellt ist.

Das Programm gibt die Texte in der entsprechenden Sprache aus, sofern für diese eine .mo-Datei existiert. Wenn keine passende .mo-Datei vorhanden ist, so benutzt das Programm die Sprache, in der es original geschrieben ist, in der Regel Englisch.

Wikibooks: Computerbasierte Übersetzung – Lern- und Lehrmaterialien

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Bruno Haible: GNU gettext 0.22.5 released. 22. Februar 2024 (englisch, abgerufen am 7. März 2024).